package com.umfb.timertask.spider;

/**
 * 正则表达式类,分离出来的话,方便修改
 */
public class SpiderRegex {

	public final static String TABLE_URL="<\\s*table\\s+[^>]*\\s*>(.*?)</table\\s*>";//找到table标签

	public final static String TABLE_TBODY="<\\s*<tbody>\\s*(.*?)\\s*</tbody>\\s*>";//找到tbody标签

	public final static String TABLE_TR="\\s*<tr>\\s*(.*?)\\s*</tr>\\s*";//找到tr标签

	public final static String TABLE_TD="\\s*<td>\\s*(.*?)\\s*</td>\\s*";//找到td标签

	public final static String TABLE_TD_ADDR="<\\s*a\\s*[^>]*\\s*>[^<img](.*?)</a>\\s*";//找到存储地址信息的标签

	public final static String TABLE_TD_NONE="(<\\s*input\\s*[^>]*\\s*/>|<\\s*a\\s*[^>]*\\s*><img.*?</a>)";//供应信息标签和商家信息标签  暂时用不到

	public final static String PAGE_DIV="\\s*<div class=\"new_page2\">\\s*(.*?)\\s*</div>\\s*";//获取页码div

	public final static String PAGE_TOTAL="\\s*<\\s*a\\s*[^>]*\\s*>\\s*(.*?)\\s*</a>\\s*";//获取存有页码数的a标签
}